知识图谱的四种存储格式,N

您所在的位置:网站首页 三元组 rdf 知识图谱的四种存储格式,N

知识图谱的四种存储格式,N

2023-04-14 17:18| 来源: 网络整理| 查看: 265

知识图谱通常是存储为的三元组形式。

实体或者值为节点,关系作为边构成图谱。

RDF (Resource Description Framework) 通常以四种格式存储: N-Triples (.nt)、Turtle (.ttl)、JSON-LD (.json)或RDF/XML (. RDF)。

nt格式呢,就是每行一个三元组,实体、关系都是最完整的格式,有前缀,很长那种。

. "Bob Marley"@en . "Bob Marley"@fr . . . . "Jamaica"@en . "Giamaica"@it . "17.9833"^^ . "-76.8"^^ . .

ttl格式,就是在开头先定义了前缀,三元组要短很多。

所以这种格式一般比nt格式小不少。

@prefix dbr: . @prefix dbo: . @prefix rdfs: . @prefix foaf: . @prefix geo: . @prefix xsd: . @prefix schema: . dbr:Bob_Marley a foaf:Person ; rdfs:label "Bob Marley"@en ; rdfs:label "Bob Marley"@fr ; rdfs:seeAlso dbr:Rastafari ; dbo:birthPlace dbr:Jamaica . dbr:Jamaica a schema:Country ; rdfs:label "Jamaica"@en ; rdfs:label "Giamaica"@it ; geo:lat "17.9833"^^xsd:float ; geo:long "-76.8"^^xsd:float ; foaf:homepage .

json格式就不用说了,常见的数据存储格式,层次化的可嵌套结构,看下面例子。

[ { "@id": "http://dbpedia.org/resource/Bob_Marley", "@type": [ "http://xmlns.com/foaf/0.1/Person" ], "http://www.w3.org/2000/01/rdf-schema#label": [ { "@value": "Bob Marley", "@language": "en" }, { "@value": "Bob Marley", "@language": "fr" } ], "http://www.w3.org/2000/01/rdf-schema#seeAlso": [ { "@id": "http://dbpedia.org/resource/Rastafari" } ], "http://dbpedia.org/ontology/birthPlace": [ { "@id": "http://dbpedia.org/resource/Jamaica" } ] }, { "@id": "http://dbpedia.org/resource/Jamaica", "@type": [ "http://schema.org/Country" ], "http://www.w3.org/2000/01/rdf-schema#label": [ { "@value": "Jamaica", "@language": "en" }, { "@value": "Giamaica", "@language": "it" } ], "http://www.w3.org/2003/01/geo/wgs84_pos#lat": [ { "@value": "17.9833", "@type": "http://www.w3.org/2001/XMLSchema#float" } ], "http://www.w3.org/2003/01/geo/wgs84_pos#long": [ { "@value": "-76.8", "@type": "http://www.w3.org/2001/XMLSchema#float" } ], "http://xmlns.com/foaf/0.1/homepage": [ { "@id": "http://jis.gov.jm/" } ] }, { "@id": "http://dbpedia.org/resource/Rastafari" }, { "@id": "http://jis.gov.jm/" }, { "@id": "http://schema.org/Country" }, { "@id": "http://xmlns.com/foaf/0.1/Person" } ]

RDF格式,好像现在已经不怎么常用了,但是作为一种标准存在。

和HTML的形式很类似,并且可以和ttl一样在开头可以定义前缀。

Bob Marley Bob Marley Jamaica Giamaica 17.9833 -76.8

选择哪种格式,实际上主要取决于你想要使用那种库去处理它们。

一般来说,现在nt和ttl这两种以每行一个三元组格式存储的格式使用得比较多,也容易处理、存储。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3